Skip to main content

HKU ICB

提示科创五大趋势,重塑 AI 多元交互

Back

13 May 2025 | 深度观点

本文转载自客座副教授、港交所董事、前红杉资本中国基金专家合伙人、前香港科技园公司董事会成员及前阿里巴巴集团副总裁兼首任数据委员会会长车品觉教授为《信报》撰写的专栏「全民大数据」,原文标题为《提示工程五大趋势》。

 

生成式人工智能(GenAI)正在快速发展,其中一个特别重要的领域,叫做提示工程(Prompt Engineering)。Prompt是指设计和优化特定的问题或指令,让人工智能(AI)系统能够有效地作出响应,从而提供相关的答案或解决方案。在一般情况下使用GPT或DeepSeek时,用户需输入问题来让AI回答。

1

Prompt是指设计和优化特定的问题或指令,让AI系统能够有效地作出响应。(shutterstock网上图片)

 

事实上,笔者作为用户一直期待这个互动过程,可以更自动化及智能化。例如,AI可以自动协助Prompt的形成及调整,帮助得到更准确的答案。但随着科技的发展,笔者发觉这问题并非这么简单,想先分享一些近期趋势:

 

1)多模态提示的兴起

2)思考过程的模拟

3)交互方式对外扩展

4)赋予角色和个性

5)形成解决问题的流程

 

1)多模态提示的兴起

现在的模型,比如GPT-4及DeepSeek,不仅可以理解文字,还可以理解图片等多种讯息。用户可上传图片并附加文本指令,这意味着你可以同时给AI发图片和文字,让它帮你解决更复杂的问题。

 

2)思考过程的模拟

一种叫做链式推理(Chain-of-Thought)的技术,是让AI模拟人类解决问题步骤的方法。在这种方法中,AI不是直接给出答案,而是像人类解决问题时那样,一步一步地阐述其思考过程。

 

思维树(Tree-of-Thoughts)是链式推理的扩展,它不仅展示了线性的思考过程,而是探索了多种可能的解决方案路径。当面对问题时,AI会模拟多个不同的思考路径,每段路径都可能导致不同的解决方案。

 

3)交互方式对外扩展

让模型在解决问题时能够调用外部工具,例如搜索引擎或应用程序编程接口(API),这种方式适用于需要实时获得讯息,更重要的是通过互动去调动专业知识。AI与外部数据库及搜索引擎的结合愈来愈普遍,这可以让模型实时获取外部数据,减少错误讯息的生成。

 

4)赋予角色和个性

大家可以不妨想象,每个个体在企业内可能担当不同的角色。通过给AI模型设定特定的角色,可让它生成更符合特定场景的回答。

 

5)形成解决问题的流程

复杂的任务可拆解成多个小问题,AI模型分阶段回答,形成有条理的工作流程。例如,先生成报告的大纲,然后逐步填充各个部分的内容。

 

笔者想表达的是,提示工程正在变得愈来愈重要和复杂,它并非单一指令那么简单,而是一个整体的互动系统及接口。尚且从个人角度如何用好它都是极大的变革,更何况是企业呢!